Evaluer la similarité textuelle de 2 pages

Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages).

Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation...

Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.

Résultats

Calculs de similarité textuelle entre les pages :

  • http://www.mybb.fr/showthread.php?tid=41&pid%3​D181
  • http://www.mybb.fr/archive/index.php/thread-41.html

Scores de similarité :

  • Dice : 31.55%
  • Jacard : 18.73%

Dice et Jacard sont deux méthodes de calcul de similarité textuelle, le résultat étant donné sous forme de pourcentage.

D'autres méthodes sont en cours d'analyse. N'hésitez pas à proposer une autre méthode ou à faire vos commentaires dans le forum dans la discussion "[outil] Calcul de similarité textuelle entre 2 pages web".

Nouveau calcul de similarité

URL de la page 1 :

URL de la page 2 :

Rappel : les outils d'optimisation du contenu

Voici les outils utilisés pour travailler les critères on page du référencement :

Rappel : les principaux outils

Voici les outils les plus souvent utilisés pour travailler son référencement :